OpenAI lanza GPT-5.5 con mejoras en autonomía para usar herramientas, programación y ejecución de tareas complejas

por Edgar Otero Hace 3 horas

OpenAI ha anunciado GPT-5.5, una nueva versión de su modelo enfocada en tareas de trabajo real sobre ordenador: escribir y depurar código, investigar en la web, analizar datos, crear documentos, manejar hojas de cálculo, usar software y completar flujos complejos con menos supervisión. Sobre el papel, la idea es clara: que el usuario deje de guiar cada paso y pueda delegar tareas más largas y ambiguas.

La compañía lo presenta con la retórica de siempre. Este es un modelo más inteligente, más autónomo y más eficiente que GPT-5.4. Como es habitual en estos lanzamientos, todas las mejoras comunicadas proceden de OpenAI, ya sea mediante pruebas internas o benchmarks controlados. Eso nos obliga a leer el anuncio con cierta cautela. En inteligencia artificial, las métricas ayudan a orientarse, pero no siempre reflejan cómo rinde un modelo en entornos reales, y además pueden condicionar el entrenamiento hacia resultados muy concretos.

Aun así, hay varios mensajes relevantes en el lanzamiento. El primero es que OpenAI insiste en llevar sus modelos más allá del chatbot y acercarlos a un rol más práctico. De lo que se trata es de hacer trabajo cotidiano en lugar de limitarse a responder preguntas. En ese terreno, GPT-5.5 se describe como un sistema más capaz para lidiar con tareas de oficina, investigación, programación y uso de herramientas conectadas.

La empresa asegura que el modelo entiende mejor la intención del usuario, necesita menos reintentos y consume menos tokens para completar ciertos trabajos, especialmente en Codex. También afirma que mantiene una latencia por token similar a la de GPT-5.4 pese a ser más capaz, un dato importante en un momento en el que los laboratorios intentan vender mejoras sin empeorar demasiado la velocidad de respuesta.

¿Qué cambia en el día a día según OpenAI?

Donde OpenAI pone más énfasis es en el trabajo profesional con herramientas. GPT-5.5 estaría mejor preparado para redactar documentos, crear presentaciones, construir hojas de cálculo y moverse entre aplicaciones hasta cerrar una tarea. La compañía también destaca mejoras en “computer use”, es decir, en la capacidad de ver interfaces, hacer clic, escribir, navegar y operar software de forma autónoma.

Eso conecta directamente con el movimiento que vimos hace apenas unas semanas, cuando OpenAI presentó GPT-5.4 como su primer modelo principal con uso autónomo del ordenador. En aquel momento, el mensaje era que la IA ya no solo razonaba o generaba texto, sino que empezaba a actuar dentro del PC. GPT-5.5 no cambia tanto de dirección como de intensidad: según la compañía, ahora lo hace mejor y con más persistencia.

También se subrayan avances en programación. OpenAI asegura que GPT-5.5 mejora en tareas de ingeniería compleja, depuración, refactorización y validación, con mejores resultados en pruebas como Terminal-Bench 2.0 o Expert-SWE frente a GPT-5.4. Pero incluso aquí conviene mantener la distancia. Y es que superar benchmarks no garantiza que el modelo sea igual de fiable en proyectos reales, donde hay contexto cambiante, deuda técnica, herramientas propias y requisitos poco claros.

Más interesante que la cifra concreta quizá sea el patrón del sector. Igual que Anthropic lanzó hace solo unos días Claude Opus 4.7 prometiendo mejoras en código y tareas largas, OpenAI responde ahora con otro salto incremental centrado en productividad, herramientas y autonomía. La sensación es que los grandes laboratorios han entrado en una dinámica de actualizaciones constantes y muy próximas, donde cada anuncio responde casi en tiempo real al del rival.

Más capacidad no siempre significa más tranquilidad para empresas

Este ritmo de lanzamientos, en realidad, nos da motivos para ser más pesimistas que optimistas. Para usuarios individuales puede significar acceso rápido a funciones nuevas, pero para empresas supone convivir con modelos que cambian continuamente. Cada nueva versión promete ser mejor, aunque también puede introducir desajustes, costes de adaptación o comportamientos inesperados. En entornos donde hay prompts afinados, agentes conectados a herramientas y procesos de negocio automatizados, una mejora no siempre equivale a una migración sencilla.

Ahí encaja también un debate cada vez más visible. Nos referimos a la posible degradación de los modelos con el tiempo. En las últimas semanas han circulado informes de usuarios avanzados que aseguran haber detectado retrocesos en la calidad de algunos sistemas una vez desplegados en producción. En el caso de Anthropic, incluso se ha publicado un extenso análisis de uso real que relaciona peores resultados con una menor profundidad de razonamiento. No es una prueba extrapolable a todo el sector ni demuestra por sí sola una práctica generalizada, pero sí refleja una preocupación creciente entre quienes dependen de estas herramientas para trabajo serio.

Por eso, el anuncio de GPT-5.5 debe leerse desde dos perspectivas. Por un lado, OpenAI describe un modelo más útil para el trabajo diario, mejor en código, documentos, investigación y uso de software. Por otro, vuelve a recordarnos que la carrera de la IA está entrando en una fase algo repetitiva. Un laboratorio lanza, el otro responde, y entre ambos convierten cada pocas semanas en una nueva “gran actualización”. La cuestión ya no es solo quién saca el siguiente modelo, sino si esas mejoras se traducen de verdad en más estabilidad, más confianza y menos fricción para quienes trabajan con ellos todos los días.

Fin del Artículo. ¡Cuéntanos algo en los Comentarios!